% !Mode:: "TeX:UTF-8"
%% !TEX program  = xelatex
%! TEX program = xelatex
%\documentclass{cumcmthesis}
\documentclass[withoutpreface]{cumcmthesis} %去掉封面与编号页，电子版提交的时候使用。
\usepackage{etoolbox}
\BeforeBeginEnvironment{tabular}{\zihao{-5}}
\usepackage{cite}
\usepackage[numbers,sort&compress]{natbib}
\usepackage[framemethod=TikZ]{mdframed}
\usepackage{url}   % 网页链接
\usepackage{subcaption} % 子标题
\usepackage{cleveref}





\lstdefinestyle{PythonStyle}{
    language=Python,
    basicstyle=\ttfamily\small,       % 等宽小字体
	keywordstyle=\color[rgb]{0.2, 0.5, 0.8},       % 关键字颜色
    commentstyle=\color{green!50!black}, % 注释颜色
    stringstyle=\color{orange},       % 字符串颜色
    backgroundcolor=\color{white},   % 浅灰背景
    frame=single,                     % 边框
    rulecolor=\color{black!20},       % 边框颜色
                 % 自动换行
    showstringspaces=false,           % 不显示空格符
    columns=fullflexible              % 避免字符间距过大
    numbers=none  % 不显示行号
}








\title{基于化学成分的古代玻璃制品的成分分析与鉴别}
\tihao{A}
\baominghao{4321}
\schoolname{武汉大学}
\membera{ 胡家润}
\memberb{ 干瑞麟}
\memberc{ 文飞扬}
\supervisor{ }
\yearinput{2025}
\monthinput{08}
\dayinput{22}
\usepackage{yhmath}
\graphicspath{{figures/}}



\begin{document}



	\maketitle
	\begin{abstract}
		玻璃是丝绸之路的宝贵物证，根据添加的助溶剂的化学成分的不同，将玻璃分为两大类别：铅钡玻璃, 高钾玻璃。研究玻璃制品的化学成分及鉴别对古代玻璃文物的保护具有重要意义。本文从成分数据分析视角出发，对玻璃的化学成分进行分析，并对不同类型的玻璃进行分类及预测。
		
		\textbf{对于问题一,}本文首先对数据进行了\textbf{预处理}，剔除了表单中的无效数据，并且对数据进行了补零处理。对于第一小问，题目要求分别研究文物表面风化与其玻璃类型、纹饰和颜色的关系，本文首先对表单1中四类别进行\textbf{数据编码}，将抽象数据转化为量化数据后，运用\textbf{Spearman方法}进行关系检验，结果表面风化仅与玻璃类型有关，与纹饰、颜色无关。对于第二小问，题目要求结合玻璃的类型，分析文物样品表面有无风化化学成分含量的统计规律，本文引入\textbf{均值、方差、标准差、变异数、偏度、峰度}等统计量来描述统计关系，并且通过柱状图反应连续变量的数据分布。对于第三小问，本文通过\textbf{贝叶斯反演模型}来预测风化前的化学成分含量，并基于现实基础，对模型加以\textbf{物理化学机制约束}，从而确保预测结果的准确性。
		
		\textbf{对于问题二,}第一小问要求分析高钾玻璃和铅钡玻璃的分类规律，本文采用\textbf{监督学习方法}，引入\textbf{决策树}法对数据进行分类，并且通过\textbf{随机森林}找出重要分类特征进行辅助验证，求解结果均以PbO作为区分玻璃类型的最重要特征。第二小问要求对不同玻璃类型进行亚类分类，本文以随机森林得到的特征变量为基础，通过\textbf{k-means聚类}进行亚类划分，并使用\textbf{轮廓系数}
		
		
		来衡量划分结果，最后将高钾玻璃划分为2个亚类，铅钡玻璃划分为4个亚类。对得到的结果进行\textbf{anova方法}进行合理性分析，并在扰动范围内进行重新赋值，发现结果无明显变化，证明模型具有合理性，且敏感性良好。
		
		\textbf{对于问题三,}题目要求通过分析表单 3 中未知玻璃类别的文物样品的化学成分，鉴别未知玻璃类别的文物编号所属类型。本文\textbf{基于问题二的建模}，运用已经训练好的决策树进行分类，并且通过\textbf{Z-score}进行交叉检验,最后对结果进行敏感性分析，发现方法在准确性和敏感性上皆有不错的表现。

		\textbf{对于问题四,}题目要求分析不同玻璃类别的化学成分之间的相关性，即分别研究高钾玻璃与铅钡玻璃的化学成分指标之间的关联。本文首先通过\textbf{clr中心转换}对预处理后的数据进行转换，以\textbf{消除闭合效应},再利用\textbf{皮尔逊系数}构建相关系数矩阵分析相关性。然后通过\textbf{Fisher-z}进行统计量转换，通过检验p值找出差异性，最后采用\textbf{Bootstrap置信区间分析}对模型进行了检验，发现模型有着良好的准确性。
	
		\keywords{ 贝叶斯反演模型 \quad 决策树法 \quad 随机森林 \quad k-means聚类 \quad 中心化对数变换}
	\end{abstract}
	
	%目录 
	\tableofcontents

	\newpage
	
	%\newpage
	

	\input{pages/section1.tex} %问题重述

	\input{pages/section2.tex} %问题分析

	\input{pages/section3.tex} %模型假设

	\input{pages/section4.tex} %符号说明
	
	
	%主体部分
	\input{pages/question/preprocessing.tex} 

	\input{pages/question/question1.tex} 
	\input{pages/question/question2.tex} 
	
	\input{pages/question/question3.tex} 
	
	\input{pages/question/question4.tex} 
	

	%结尾部分

	\input{pages/section5.tex} %模型评价

	\begin{thebibliography}{99}
		\bibitem{pa} H.~Partl:
        \emph{German \TeX},
     	TUGboat Volume~9, Issue~1 (1988)
	\end{thebibliography}
	\input{pages/appendices.tex} %附录文件

\end{document} 